中国南极科学考察CTD数据集

林丽娜1,王颖杰1,  2,  1*,陈红霞1,  1,3,  1

1. 国家海洋局第一海洋研究所,青岛 2660612. 中国极地研究中心,上海 200136
3.
同济大学海洋与地球科学学院,上海 200092

  要:中国开展南极科学考察工作已30余年。在这一时期,海洋调查技术与极地科考设备快速发展,中国极地科考也经历了由起步到成熟的发展历程。至2014年,中国已进行了30次南极科学考察,考察重点海域集中在南极半岛和普里兹湾及邻近海域。本文尽可能完备地收集了各南极航次的水文调查CTD数据;在此基础上,参考各航次现场观测记录,将不同调查设备和数据采集处理软件得到的数据进行格式统一和奇异值剔除,最后得到包含压强、深度、温度、盐度、密度、声速和位温等要素的数据集。该数据集是我国南极水文考察成果的结晶,可为南极各学科研究提供参考和数据基础,为数值模拟研究提供初始场和验证资料。

关键词:南极;中国;科学考察;水文;CTD

DOI: 10.3974/geodp.2017.02.04

 

1  前言

中国南极科学考察已经持续进行了30余年,CTD观测(Conductance电导,Temperature温度,Depth深度)因其可靠性和稳定度成为综合海洋水文环境调查的基础手段。除第2451012172023次南极科学考察因没有搭载船只、承担建站和陆地科考任务等原因,未进行海洋综合考察外,在其余包含水文调查的航次均进行了CTD观测。至今为止,已积累了丰富的调查资料[1]

30余年的科学考察中,海洋调查技术与极地科考设备快速发展,极地考察队伍的人员组成和知识结构都发生了较大的变化。以CTD调查为例,在雪龙船装备SBE 911 CTD以前,用于水文调查的主要设备存在多种类型,有时使用船上的自带设备,有时为派出单位自备设备。因采样设备不同、数据处理人员不同、数据归档管理的要求不同,最终提交的数据在数据格式、垂向分辨率、包含要素等方面都各不相同,难以被科研人员有效利用。

本文尽可能完备地收集各个南极航次的CTD水文调查数据,并依据数据是否为原始记录、后处理结果以及根据航次的现场记录情况或者航次执行人的口头描述,按照不同设备的数据处理要求进行了规范到1 m一个记录的处理。为了避免采水时带来的干扰,以及压力传感器在上升过程中的存在回复较慢的特点,数据处理时也尽可能采用下降过程的原始记录。因仪器自身的原因造成的数据整体偏差、原始数据记录不完整或者有误、或者只具备若干层面上记录则尽可能完整和真实地反应原始信息。

中国南极科学考察CTD数据是研究该区域物理海洋环境的首要数据,也是了解该海域水文性质及环流特征重要的基础性数据。该数据是在各次南极科学考察数据的基础上,开发的包含压强、深度、温度、盐度、密度、声速和位温等要素的数据集[2]

2  数据集元数据简介

南极海域水文CTD数据集的名称、作者、地理区域、数据年代、时间分辨率、空间分辨率、数据集组成、数据出版与共享服务平台、数据共享政策等信息见表1

1  南极海域水文CTD数据集元数据简表

 

 

数据集名称

中国南极30年科考CTD数据集

 

数据集短名

CTD_data_CHINARE_1985-2014

 

作者信息

林丽娜 L-6637-2016, 国家海洋局第一海洋研究所, linln@fio.org.cn

王颖杰 A-3180-2017, 国家海洋局第一海洋研究所, wangyj@fio.org.cn

  L-4784-2016, 中国极地研究中心, zhangjie@pric.org.cn

  L-6646-2016, 国家海洋局第一海洋研究所, liun@fio.org.cn

陈红霞 A-4871-2017, 国家海洋局第一海洋研究所, chenhx@fio.org.cn

  A-3202-2017, 同济大学, kongbin@fio.org.cn

  A-3216-2017, 国家海洋局第一海洋研究所, heyan@fio.org.cn

 

地理区域

地理范围包括50°S-69°N70°W-110°E

主要包括:南极半岛附近海域、普里兹湾及邻近海域

 

数据年代

19851987199019911992199319941995199719981999200020012002200320042005200620072008200920102011201220132014

 

空间分辨率

垂向1 m

 

数据文件个数

912

 

数据格式

.dat

 

数据量 

90 MB

 

数据集组成

数据集共包含22个数据文件夹,每个文件夹包含1个南极航次的CTD数据集和1word文件。word文件包含航次站位信息表和站位分布图,文件夹名字以阿拉伯数字命名,每个数字代表对应的第几次南极科学考察

 

基金项目

中华人民共和国科学技术部(2014T02, 2014G02, 2011AA090401);国家海洋局(201405031, 20150102

 

出版与共享服务平台

全球变化科学研究数据出版系统 http://www.geodoi.ac.cn

 

地址

北京市朝阳区大屯路甲11 100101,中国科学院地理科学与资源研究所

 

数据共享政策

全球变化科学研究数据出版系统的“数据”包括元数据(中英文)、实体数据(中英文)和通过《全球变化数据学报》(中英文)发表的数据论文。其共享政策如下:(1)“数据”以最便利的方式通过互联网系统免费向全社会开放,用户免费浏览、免费下载;(2)最终用户使用“数据”需要按照引用格式在参考文献或适当的位置标注数据来源;(3)增值服务用户或以任何形式散发和传播(包括通过计算机服务器)“数据”的用户需要与《全球变化数据学报》(中英文)编辑部签署书面协议,获得许可;(4)摘取“数据”中的部分记录创作新数据的作者需要遵循10%引用原则,即从本数据集中摘取的数据记录少于新数据集总记录量的10%,同时需要对摘取的数据记录标注数据来源[3]

 

3  数据集覆盖范围和组成

3.1  南极CTD数据覆盖的地理范围

中国南极科学考察CTD数据集的地理范围为:50°S-69°S70°W-110°E(图1-1,图1-2)。主要包括:南极半岛附近海域、普里兹湾及邻近海域。为了数据开发和下载方便,每个站点的水文要素作为一个数据文件。

 

 

1-1  中国历次南极科学考察CTD观测站位图(第136-91113-16次)


 

1-2  中国历次南极科学考察CTD观测站位图(第1819212224-30次)

3.2  数据集的组成

中国南极科学考察CTD数据集的全部数据由912个数据文件(.dat)组成,每一个文件包含:压强(db)、深度(m)、温度()、盐度(psu)、密度(kg/m3)、声速(m/s)、位温()等要素。在数据集中,采用所测的站点命名每一个数据集。例如:IS-01.dat代表IS-01站位的水文CTD数据。

2  中国南极科学考察CTD数据统计表

航次

数据文件数

CTD类型

主要作业区域

备注

1

34

MarkIII

南极半岛附近海域

标准层数据

3

28

未标示

南极半岛附近海域

标准层数据

6

19

未标示

普里兹湾及其外部

标准层数据

7

37

未标示

普里兹湾及其东部

标准层数据

8

32

未标示

普里兹湾及其东部

标准层数据

9

38

未标示

普里兹湾及其外部,南极半岛附近

标准层数据

11

7

MarkIII

普里兹湾及其外部

标准层数据

13

24

MarkIII

普里兹湾及其外部

2 m间隔

14

15

未标示

普里兹湾内部

1 m间隔

15

21

未标示

普里兹湾及其外部

1 m间隔

16

19

MarkIII

普里兹湾及其外部

1 m间隔

18

68

MarkIII

普里兹湾及其外部

1 m间隔

19

44

MarkIII/

SBE 25

普里兹湾及其外部,冰架前缘断面

1 m间隔

21

94

MarkIII

普里兹湾及其外部,中山-长城两站航线

1 m间隔

22

48

MarkIII

普里兹湾及其外部,澳大利亚以南ACC

1 m间隔

24

50

ALEC/SBE 25

普里兹湾及其外部,站间航线站位

1 m间隔

25

47

SBE 911

普里兹湾及其外部

1 m间隔

26

52

SBE 911

普里兹湾及其外部

1 m间隔

27

62

SBE 911

普里兹湾及其外部,冰架前缘断面

1 m间隔

28

67

SBE 911

普里兹湾及其外部,冰架前缘断面,南极半岛附近

1 m间隔

29

66

SBE 911

普里兹湾

1 m间隔

30

40

SBE 911

南极半岛和普里兹湾

1 m间隔

 

4  数据处理过程和质量控制

24次南极科学考察以前,CTD调查设备存在多种类型,因此在数据格式、垂向分辨率、包含要素等方面都存在差异。自第25次南极科学考察开始,雪龙船装备了SBE 911 CTD,使得极地水文调查更加规范。因此数据处理分两种情况,具体过程如下:

4.1  1次至第24次南极科学考察CTD数据处理

由于数据获取时间较早,且每个航次的现场调查和数据处理人员均有变动,不清楚当时的现场情况,因此很难获得原始数据重新处理。因此,这部分数据处理主要是在航次汇交数据的基础上进行了以下处理。

1)数据格式统一

原始数据存储有.xls.txt.cnv.dat等多种格式,不方便查阅和处理,于是统一将各站位数据存储为.dat文件,同时将各站位信息提取出来,制成各航次站位信息表,包含站位名称、时间、经度、纬度、水深和最大观测深度等基本信息。

这里需要说明的是,若数据文件同时包含下降和上升数据,则首选下降数据,若下降数据误差较大或者只有上升数据的情况,则选择上升数据。

2)数据内容统一

a. 统一海洋要素,使每个数据文件均包含海洋要素深度、压强、温度、盐度、密度、声速、位温等。缺少的要素通过计算得到,计算所用的方法参照SBE 911数据处理方法。密度统一为条件密度,即在一个标准大气压下海水的密度,仅是温度和盐度的函数,计算依据1980年国际海水状态方程(EOS80)。声速计算运用Chen-Millero算法[4],选取这种算法是由于研究表明,三种声速算法(Wilson算法、Del Grosso算法和Chen-Millero算法)中,Chen-Millero算法在积分平均意义上最好,在200-800 m内更精确[5]

b. 统一数据间隔,各航次数据的间隔各不相同,13航次以前数据主要为标准层数据,100 m以内间隔为2 m或者5 m200 m以下间隔为100 m,由于数据间隔太大,难以插值,所以这些数据未做任何处理;14航次以后,数据间隔为1 m0.1 m或者24 Hz采样未处理的数据,针对这种情况,将所有间隔小于1 m的数据统一平均为1 m

3)数据质量控制

若不采取质量控制措施,CTD即使再先进、测量精度再高,同样不能够获得高质量的资料[6]。因此在统一数据后,对数据进行初步的质量控制。首先查阅了各航次相关现场观测记录,了解观测前的校正与维护情况、观测中的现场比测情况以及实时观测的环境条件,审查是否含有因偶然因素而造成的误差,目的是对数据质量有一个初步的了解。例如在查阅过程中发现,19航次报告中记录MarkIII-CTD出现问题,数据质量比较差,部分站位使用海鸟SBE 25-CTDMarkIII- CTD捆绑下放,所以下一步的处理则将重点放在SBE 25- CTD数据上。

第二步绘制各站点温盐密剖面图,进行人工修正。对于明显的异常值,如温盐存在1- 3个观测值的明显偏差或密度存在不合理的跃层变化,经过分析确定是错误值的则直接剔除。如图2所示,在1,800 m附近有一处盐度为负,是典型的异常值,可以通过编程或者手动剔除。对于无法确定的情况,则予以保留,因为有些异常值本身就是海洋环境要素异常变化的真实反映。

4.2  25次至第30次南极科学考察CTD数据处理

自第25次南极科学考察开始,CTD观测开始使用雪龙船配备的SBE 911系统,该系统是一种高精度温盐深测量系统,配有双温双导探头。尽管SBE 911采样频率高,得到的数据质量很好,但是也会受到仪器自身和现场状况的影响,从而使我们得到的数据不够精确[7]。所以仍需对SBE 911采集的数据进行处理,其自带的SBE Data Processing软件可以对数据进行初步处理。需要注意的是,这个软件无法剔除泵未开启前的数据,因此需要在处理之前先编程去掉泵未开的数据。简要步骤如下:

2  剔除异常值示例(左图为处理前,右图为处理后)

1)数据转换(Data Conversion):主要功能是将2进制或16进制的原始数据文件转换为可供下一步处理的工程文件(.cnv)。使用时要保证采用正确的标定文件,检查各传感器参数与其是否一致。同时,菜单中观测模式的选择一定要正确。只能转换压强、温度、电导率等直接观测的变量,不要转换以PTC为参数的计算量,如盐度、密度等。

2)去除泵未开数据:编程将泵未开的数据去除,同时由于CTD投放时是下放至5 m左右感温至泵打开,然后上升再下放,所以将下放到上升的这段数据也编程删除。

3)滤波(Filter):一是为了将温度和盐度的时间常数相匹配;二是对压力信号进行平滑,为去掉数据中由于船的起伏造成的数据打结部分做准备。其中参考CTD文件说明取conductivity=0.03 spressure=0.15 s

4)滞后校正(align ctd):用于调整温度和盐度传感器相对于压力传感器时间上的差距以获得相同深度上的准确水团性质数据。对于SBE911plus,以上工作在数据实时传输的时候已由CTD的甲板单元完成。

5)电导修正(Cell Thermal Mass):电导测量和计算会受到电导单元与周围环境的热传导过程的影响。因为电导单元本身由玻璃和塑料制造,玻璃单元会存储能量,所以当电极单元由热水到冷水时,经过电导单元的水就会被加热;反之,经过电导单元的水则会被降温。这种热量转化可以通过这个模块来修正,被修正的对象是电导率。处理时取值Primary and secondary all with alpha=0.031/beta=7.0

6“打结”校正(Loop Edit):主要功能是将由于船身起伏所导致的错误数据部分去除掉。当船只上下起伏时,会造成仪器下降速率变化,下降速率的减小,会使传感器对同一水层反复采样,从而导致了采样数据的不准确。这种错误数据并不能被修正,只能去掉。

7)平均(Bin Average):将原始数据按照研究的需要,进行时间或深度上的平均。

8)计算变量(Derive):以测得的PTC作为参数,计算出盐度、密度、位势温度、位势密度等。原始资料预处理的最终输出多为深度、温度、盐度、密度和声速等要素,本过程即可通过基本要素计算出处理要求输出的要素[8]

9)分离(Split):将上升、下降数据分开。

10)数据提取(Strip):提取需要的要素(非必须)。

11)去除表头信息(AscII Out):去除表头信息(非必须)。

12)画图(sea plot),人工修正:初步画图,进行人工修正。对于明显的异常值,如温盐存在1-3个观测值的明显偏差或密度存在不合理的跃层变化,经过分析确定是错误值的则直接剔除。

近年来的南极科学考察都采用国际先进水平的海鸟911 CTD,采集的原始资料质量和精度都得到了保障;并且经过上述规范化的处理步骤,资料质量保持了较高水平,格式也较为统一与明确,处理后的CTD 资料能迅速应用到各学科中去,高质高效,收效甚好[9]

5  结论

中国南极科学考察CTD数据集是以我国历次南极科学考察CTD调查数据为基础,收集整理的具有统一格式、分辨率和水文要素的数据集,汇集了我国南极科学考察的水文调查成果。它不仅是南极水文研究的基础,也为模式模拟和其他学科提供了重要的参考,是我国极地考察的重要成果,也是了解南极海洋环境的基础数据。

 

作者分工在数据与数据论文完成过程中,刘娜负责总体设计,林丽娜采集、处理了数据,林丽娜、王颖杰进行了数据分析、验证,并撰写论文;张洁、陈红霞、孔彬和何琰参与了数据分析、验证和论文修改等。

参考文献

[1]       陈红霞, 刘娜, 张洁等. 中国极地科学考察水文数据图集概论[M]. 北京:海洋出版社, 2014.

[2]       林丽娜, 王颖杰, 张洁等. 中国南极科学考察CTD数据集[DB/OL]. 全球变化科学研究数据出版系统, 2016. DOI: 10.3974/geodb.2016.01.13.V1.

[3]       全球变化科学研究数据出版系统. 全球变化科学研究数据共享政策[OL]. DOI: 10.3974/dp.policy.2014.05 (2017年更新).

[4]       Chen, C. T., Millero, F. J. Speed of sound in sea water at high pressures [J]. Journal of the Acoustical Society of America, 1977, 62(5): 1129-1135.

[5]       陈红霞, 吕连港, 华锋等. 三种常用声速算法的比较[J]. 海洋科学进展, 2005, 23(3): 359-362.

[6]       陈淼, 李占桥, 袁延茂等. 海鸟系列CTD数据预处理分析[J]. 海洋测绘, 2004, 24(6): 62-64.

[7]       杨少磊, 谢玲玲, 杨庆轩. SBE 911 plus CTD剖面仪的现场校正与数据处理[J]. 海洋技术, 2008, 27(3): 23-26.

[8]       许建平, 苏纪兰. CTD资料质量控制浅析[J]. 海洋学报, 1999, 21(1): 126-132.

[9]       匡晓迪, 郭心顺, 范洪涛. CTD资料预处理规范化的探讨[J]. 海洋技术, 2009, 28(2): 33-36.